首页> 外文OA文献 >Maximin effects in inhomogeneous large-scale data
【2h】

Maximin effects in inhomogeneous large-scale data

机译:maximin对非均匀大规模数据的影响

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Large-scale data are often characterized by some degree of inhomogeneity asdata are either recorded in different time regimes or taken from multiplesources. We look at regression models and the effect of randomly changingcoefficients, where the change is either smoothly in time or some otherdimension or even without any such structure. Fitting varying-coefficientmodels or mixture models can be appropriate solutions but are computationallyvery demanding and often return more information than necessary. If we just askfor a model estimator that shows good predictive properties for all regimes ofthe data, then we are aiming for a simple linear model that is reliable for allpossible subsets of the data. We propose the concept of "maximin effects" and asuitable estimator and look at its prediction accuracy from a theoretical pointof view in a mixture model with known or unknown group structure. Under certaincircumstances the estimator can be computed orders of magnitudes faster thanstandard penalized regression estimators, making computations on large-scaledata feasible. Empirical examples complement the novel methodology and theory.
机译:大型数据通常以某种程度的不均匀性为特征,因为数据要么在不同的时间范围内记录,要么从多个来源获取。我们看一下回归模型和随机变化系数的影响,其中变化在时间上或在其他维度上是平稳的,甚至没有任何这样的结构。拟合变化系数模型或混合模型可能是合适的解决方案,但计算量很大,并且经常返回比必要更多的信息。如果我们只需要一个模型估计器,该模型估计器对所有数据模式都具有良好的预测特性,那么我们的目标是建立一个对所有可能的数据子集都可靠的简单线性模型。我们提出了“最大化效应”的概念和一个合适的估计量,并从理论的角度在具有已知或未知组结构的混合模型中研究了其预测精度。在某些情况下,可以比标准的惩罚回归估计器更快地计算数量级,从而使在大规模数据上进行计算变得可行。经验例子补充了新颖的方法论和理论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号